Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles

نویسندگان

  • Trong-Ton Pham
  • Loïc Maisonnasse
چکیده

We describe here a method to use a language modeling approach for image retrieval and image categorization. Since photographic images are 2D data, we first use image regions (mapped to automatically induced concepts) and then spatial relationships between these regions to build a complete image graph representation. Our method deals with different scenarios, where isolated images or groups of images are used for training and/or testing. The results obtained on an image categorization problem show (a) that the procedure to automatically induce concepts from an image is effective, and (b) that the use of spatial relationships, in addition to concepts, for representing an image content helps improve the classifier accuracy. This approach extends the language modeling approach to information retrieval to the problem of graph-based image retrieval and categorization, without considering image annotations. MOTS-CLÉS : Représentation de graphes, recherche d’image, catégorisation d’image

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Un modèle génératif pour l'Apprentissage de la Topologie

Résumé. Un nuage de points est plus qu’un ensemble de points isolés. La distribution des points peut être gouvernée par une structure topologique cachée, et du point de vue de la fouille de données, modéliser et extraire cette structure est au moins aussi important que d’estimer la seule densité de probabilité du nuage. Dans cet article, nous proposons un modèle génératif basé sur le graphe de ...

متن کامل

HuMan vision PercePtion in built environMent Applying image-based approach for architectural cue recognition

This paper first presents a review on visual perception in the built environment and human vision simulation. Followed by the description of the Standard Feature Model of visual cortex (SFM), an architectural cue recognition model is proposed using SFM-based features. Based on the findings of the experiments it can be concluded that the visual differences between architectural cues are too subt...

متن کامل

Conception automatisée de modèles de page en vue de leur utilisation en reconnaissance de documents

RÉSUMÉ. Le but de cet article est de décrire un modèle de page utilisé en reconnaissance de documents et sa construction automatisée. Ayant choisi une modélisation fondée sur la perception, l’architecture du modèle se confond avec la description physique des pages. La structure logique est décrite en termes de relations et d’attributs associés aux composants physiques. L’apprentissage est réali...

متن کامل

Une représentation en graphe pour l'enseignement de XML

XML est un format actuellement très utilisé. Dans le cadre des formations en informatique, il est indispensable d’initier les étudiants à ce format et, surtout, à tout son éco-système. Nous avons donc mis au point un modèle permettant d’appuyer l’enseignement de XML. Ce modèle propose de représenter un schéma XML sous la forme d’un graphe mettant en valeur les caractéristiques structurelles des...

متن کامل

Modélisation de relations dans l'approche modèle de langue en recherche d'information

RÉSUMÉ. Nous abordons dans cet article le problème de la prise en compte de relations (par exemple de nature syntaxique ou sémantique) dans un modèle de langues en recherche d’information. En particulier, nous proposons, sur la base du modèle de langue, un cadre complet pour la prise en compte de relations, étiquetées ou non. Afin d’illustrer ce cadre, nous avons conduit une série d’expériences...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Document Numérique

دوره 13  شماره 

صفحات  -

تاریخ انتشار 2010